首页> 外文OA文献 >A Generalized Processor Mapping Technique for Array Redistribution
【2h】

A Generalized Processor Mapping Technique for Array Redistribution

机译:阵列重新分配的通用处理器映射技术

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

[[abstract]]©2001 IEEE-In many scientific applications, array redistribution is usually required to enhance data locality and reduce remote memory access in many parallel programs on distributed memory multicomputers. Since the redistribution is performed at runtime, there is a performance trade-off between the efficiency of the new data decomposition for a subsequent phase of an algorithm and the cost of redistributing data among processors. In this paper, we present a generalized processor mapping technique to minimize the amount of data exchange for BLOCK-CYCLIC(kr) to BLOCK-CYCLIC(r) array redistribution and vice versa. The main idea of the generalized processor mapping technique is first to develop mapping functions for computing a new rank of each destination processor. Based on the mapping functions, a new logical sequence of destination processors can be derived. The new logical processor sequence is then used to minimize the amount of data exchange in a redistribution. The generalized processor mapping technique can handle array redistribution with arbitrary source and destination processor sets and can be applied to multidimensional array redistribution. We present a theoretical model to analyze the performance improvement of the generalized processor mapping technique. To evaluate the performance of the proposed technique, we have implemented the generalized processor mapping technique on an IBM SP2 parallel machine. The experimental results show that the generalized processor mapping technique can provide performance improvement over a wide range of redistribution problems
机译:[[抽象]]©2001 IEEE-在许多科学应用中,通常需要使用数组重新分配来增强数据局部性并减少分布式内存多计算机上许多并行程序中的远程内存访问。由于重新分配是在运行时执行的,因此在算法后续阶段的新数据分解效率与在处理器之间重新分配数据的成本之间需要进行性能折衷。在本文中,我们提出了一种通用的处理器映射技术,以最大程度地减少BLOCK-CYCLIC(kr)到BLOCK-CYCLIC(r)数组重新分配的数据交换量,反之亦然。通用处理器映射技术的主要思想是首先开发用于计算每个目标处理器的新等级的映射功能。基于映射功能,可以导出目标处理器的新逻辑序列。然后,使用新的逻辑处理器序列来最大程度地减少重新分配中的数据交换量。通用处理器映射技术可以处理具有任意源和目标处理器集的阵列重新分配,并且可以应用于多维阵列重新分配。我们提出了一个理论模型来分析广义处理器映射技术的性能改进。为了评估所提出技术的性能,我们已经在IBM SP2并行计算机上实现了通用处理器映射技术。实验结果表明,通用处理器映射技术可以在广泛的重新分配问题上提高性能

著录项

  • 作者

    Ching-Hsien Hsu;

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 [[iso]]en
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号